期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于最大熵深度强化学习的双足机器人步态控制方法
李源潮, 陶重犇, 王琛
《计算机应用》唯一官方网站    2024, 44 (2): 445-451.   DOI: 10.11772/j.issn.1001-9081.2023020153
摘要201)   HTML4)    PDF (2699KB)(84)    收藏

针对双足机器人连续直线行走的步态稳定控制问题,提出一种基于最大熵深度强化学习(DRL)的柔性演员-评论家(SAC)步态控制方法。首先,该方法无需事先建立准确的机器人动力学模型,所有参数均来自关节角而无需额外的传感器;其次,采用余弦相似度方法对经验样本分类,优化经验回放机制;最后,根据知识和经验设计奖励函数,使双足机器人在直线行走训练过程中不断进行姿态调整,确保直线行走的鲁棒性。在Roboschool仿真环境中与其他先进深度强化学习算法,如近端策略优化(PPO)方法和信赖域策略优化(TRPO)方法的实验对比结果表明,所提方法不仅实现了双足机器人快速稳定的直线行走,而且鲁棒性更好。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 应对零日攻击的混合车联网入侵检测系统
方介泼 陶重犇
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023091328
预出版日期: 2024-01-31